# usage: get-categories.py wiki_dump target_dir

import re

with open(text, encoding = "cp1251") as textFile:
	for line in textFile:
		if (re.match("\{\{(Футболист|Хоккеист|Баскетболист|Стадион|Карточка ФК|Хоккейный клуб|Государство|НП-[А-ЯЁа-я\- ]+|НП)")):
			while(line.replace("\n", "") != "</page>"):
				line = textFile.readline()